Autores: Davi Augusto, Felipe Hedlund e João Arend.


1 Objetivo de pesquisa

Analisar os jogadores da NBA.

O intuito inicial de nossa pesquisa era analisar o desempenho e impacto dos jogadores de basquete ao longo das últimas duas décadas (1996-2021), buscando compreender as mudanças nas tendências em relação às evoluções na filosofia do jogo e nas estratégias de desenvolvimento. Contudo, à medida que adquirimos e examinamos os dados, as médias e o desempenho de LeBron James emergiram com destaque, capturando nossa atenção de forma marcante.

Diante das evidências do impacto extraordinário de LeBron James no esporte, decidimos expandir nossa análise. Além de avaliar o desempenho e impacto dos demais jogadores, nos dedicamos a compará-los com a grandiosidade de LeBron James, reconhecido estatisticamente como um dos maiores jogadores de todos os tempos. Essa nova abordagem enriqueceu significativamente nossas descobertas e proporcionou uma perspectiva mais completa sobre as trajetórias de carreira dos jogadores ao longo dessas últimas duas décadas.

2 Sobre os dados

O conjunto de dados contém mais de duas décadas de informações sobre cada jogador que fez parte do elenco de equipes da NBA. Ele inclui variáveis demográficas como idade, altura, peso e local de nascimento, detalhes biográficos como o time em que jogou, ano e rodada do draft. Além disso, possui estatísticas básicas de pontuação, como número médio de jogos disputados, pontos, rebotes, assistências, etc.

2.1 Tipos de variáveis encontradas no banco de dados:

2.1.1 Qualitativas

Nominais: Nomes de jogadores, times, Nacionalidade…
Ordinais: NA

2.1.2 Quantitativas

Discretas: pontos, rebotes …
Contínuas: idade, altura, peso …

2.2 Código e organização dos dados

Esta parte do código esta sendo utilizada e reservada para organização de variáveis como a criação de novas para o intuito de pesquisa e utilização do dataset para as análises

## Realizando as mudanças necessárias
# retirando a primeira coluna que serve de numeração para ID
nba_dataset <- nba_dataset[, -1]

## Adicionando uma nova coluna 'year' extraindo o ano da coluna 'season'.
nba_dataset$year <- as.integer(substring(nba_dataset$season, 1, 4))

## Novas colunas <-  jogos jogados * média de pontos/rebotes/assist
nba_dataset <- nba_dataset %>%
  mutate(pts_gp = as.integer(gp * pts),
         reb_gp = as.integer(gp * reb),
         ast_gp = as.integer(gp * ast))

# Soma os stats de todas as temporadas por jogador
nba_dataset <- nba_dataset %>%
  group_by(player_name) %>%
  mutate(total_pts    = cumsum(pts_gp),
         total_reb    = cumsum(reb_gp),
         total_ast    = cumsum(ast_gp),
         total_gp     = cumsum(gp),
         total_pts_gp = total_pts / total_gp,
         total_reb_gp = total_reb / total_gp,
         total_ast_gp = total_ast / total_gp)

# Número dos top pontuadores da NBA
n_top_scorers <- 10

# Calcula a soma de pontos para cada jogador e ordena em decrescente.
top_scorers <- nba_dataset %>%
  arrange(desc(total_pts)) %>%
  distinct(player_name, .keep_all = TRUE) %>%
  group_by(player_name) %>%
  filter(row_number(desc(total_pts)) == 1)

3 Tabela Maiores Pontuadores

Tabela dos top 10 maiores pontuadores da NBA de 1996-2022:

Nome Idade Número de Jogos Pontos Pontos/Jogo Rebotes Assist Última Temporada
LeBron James 37 1366 37052 27.12445 10193 10035 2021-22
Kobe Bryant 37 1346 33626 24.98217 7043 6311 2015-16
Dirk Nowitzki 41 1522 31553 20.73127 11473 3659 2018-19
Carmelo Anthony 38 1260 28277 22.44206 7801 3430 2021-22
Tim Duncan 40 1392 26492 19.03161 15075 4230 2015-16
Paul Pierce 39 1343 26406 19.66195 7507 4694 2016-17
Vince Carter 43 1541 25714 16.68657 6603 4696 2019-20
Kevin Durant 33 939 25519 27.17678 6650 4028 2021-22
Kevin Garnett 40 1382 25231 18.25687 14136 5291 2015-16
Ray Allen 38 1300 24488 18.83692 5258 4366 2013-14

4 Tabela Maiores Pontuadores por jogo

Tabela dos jogadores com maior razão de pontos por jogo:

Nome Idade Número de Jogos Pontos Pontos/Jogo Rebotes Assist Última Temporada
Kevin Durant 33 939 25519 27.17678 6650 4028 2021-22
LeBron James 37 1366 37052 27.12445 10193 10035 2021-22
Allen Iverson 35 914 24376 26.66958 3388 5619 2009-10
Luka Doncic 23 264 6956 26.34848 2253 2100 2021-22
Joel Embiid 28 328 8534 26.01829 3730 1082 2021-22
Zion Williamson 20 85 2187 25.72941 590 275 2020-21
Michael Jordan 40 306 7794 25.47059 1800 1262 2002-03
Trae Young 23 280 7074 25.26429 1083 2543 2021-22
Kobe Bryant 37 1346 33626 24.98217 7043 6311 2015-16
James Harden 32 942 23468 24.91295 5290 6395 2021-22



##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   2.767   5.067   6.230   8.373  27.177



5 Participação em quadra

Na curiosidade de descobrir quem é o jogador com o maior total de pontos da liga no período de 1996-2021 me veio a idéia “pontuar, legal, mas e quanto as outras qualidades?” Então fizemos este gráfico com o intuito de mostrar o quão aparente são as outras qualidades destes grandes pontuadores

# Especificando o nome para as colunas de eixo_x e y, bubble size e texto
x_axis        <- "total_ast"
y_axis        <- "total_reb"
bubble_column <- "name"
size_column   <- "total_pts"
text_column   <- "player_name"

figure <- plot_ly(data = head(top_scorers, n_top_scorers),
                  x    = ~get(x_axis),
                  y    = ~get(y_axis),
                  text   = ~paste(get(text_column)),
                  marker = list(size = ~get(size_column) * 0.002, opacity = 0.2, color = '#17408B'),
                  type   = "scatter",
                  mode   =  "markers",
                  hoverinfo = "marker",
                  textfont  = list(size = 10))

figure <- figure %>%
  layout(xaxis = list(title = "Total de Assistências"),
         yaxis = list(title = "Total de Rebotes"),
         title = "Assistências e Rebotes dos maiores pontuadores da liga")

figure
x_axis        <- "total_ast"
y_axis        <- "total_pts"
bubble_column <- "name"
size_column   <- "total_reb"
text_column   <- "player_name"

figure <- plot_ly(data   = top_scorers,
                  x      = ~get(x_axis),
                  y      = ~get(y_axis),
                  text   = ~paste(get(text_column)),
                  marker = list(size = ~get(size_column) * 0.02, opacity = 0.2, color = '#17408B'),
                  type   = "scatter",
                  mode   =  "markers",
                  size   = ~get(y_axis))

figure <- figure %>%
  layout(xaxis = list(title = "Total de Assistências"),
         yaxis = list(title = "Total de Pontos"),
         title = "Pontos e Assistências dos maiores pontuadores da liga")

figure



6 Médias de pontuações, rebotes e assitências comparadas ao longo do tempo.

Ao notar o grande equilibrio e certo destaque do nosso grande pontuador LeBron James foi natural que comparássemos suas médias com as de outros jogadores presentes no top 10 pontuadores, então, foi realizada a média dos top 3 maiores jogadores da tabela no caso: LeBron James, Kobre Bryant e Dirk Nowitzki.

# Filtrando banco por jogadores
lebron_data <- subset(nba_dataset, player_name == "LeBron James")
kobe_data   <- subset(nba_dataset, player_name == "Kobe Bryant")
dirk_data   <- subset(nba_dataset, player_name == "Dirk Nowitzki")

#################
### GRÁFICO 1 ###
#################

#Médias LeBron
lebron_averages <- ggplot(lebron_data, aes(x = year)) +
  geom_line(aes(y = pts, color = "Points"),   linewidth = 1.5) +
  geom_line(aes(y = reb, color = "Rebounds"), linewidth = 1.5) +
  geom_line(aes(y = ast, color = "Assists"),  linewidth = 1.5) +
  labs(title = "LeBron James Média-Pontos Por Temporada",
       x     = "Temporadas(anos)",
       y     = "Médias",
       color = "Stats") +
  theme_minimal() +
  scale_color_manual(values = c("Points"   = "lightblue",
                                "Rebounds" = "orange",
                                "Assists"  = "lightgreen")) +
  expand_limits(y = c(0, 40))

#################
### GRÁFICO 2 ###
#################

# Médias Kobe
kobe_averages <- ggplot(kobe_data, aes(x = year)) +
  geom_line(aes(y = pts, color = "Points"),   linewidth = 1.5) +
  geom_line(aes(y = reb, color = "Rebounds"), linewidth = 1.5) +
  geom_line(aes(y = ast, color = "Assists"),  linewidth = 1.5) +
  labs(title = "Kobe Bryant Média-Pontos Por Temporada",
       x     = "Temporadas(anos)",
       y     = "Médias",
       color = "Stats") +
  theme_minimal() +
  scale_color_manual(values = c("Points"   = "lightblue",
                                "Rebounds" = "orange",
                                "Assists"  = "lightgreen")) +
  expand_limits(y = c(0, 40))

#################
### GRÁFICO 3 ###
#################

# Médias Dirk
dirk_averages <- ggplot(dirk_data, aes(x = year)) +
  geom_line(aes(y = pts, color = "Points"),   linewidth = 1.5) +
  geom_line(aes(y = reb, color = "Rebounds"), linewidth = 1.5) +
  geom_line(aes(y = ast, color = "Assists"),  linewidth = 1.5) +
  labs(title = "Dirk Nowitzki Média-Pontos Por Temporada",
       x     = "Temporadas(anos)",
       y     = "Médias",
       color = "Stats") +
  theme_minimal() +
  scale_color_manual(values = c("Points"   = "lightblue",
                                "Rebounds" = "orange",
                                "Assists"  = "lightgreen")) +
  expand_limits(y = c(0, 40))

7 Conclusão sobre o King James(LeBron)

Em suma, nossa pesquisa analítica nos permitiu uma jornada fascinante pelo mundo do basquete nas últimas duas décadas (1996-2021). Ao investigarmos o desempenho e o impacto dos jogadores, inicialmente focados nas tendências de idade, altura e peso, nos deparamos com uma verdadeira lenda do esporte: LeBron James.

Com base em análises minuciosas de dados e estatísticas, fica claro que LeBron James é, inquestionavelmente, o jogador matematicamente mais forte e dominante da liga nesse período. Suas médias impressionantes, tanto em estatísticas individuais quanto em contribuições para a equipe, revelam a magnitude de seu talento e a influência que exerceu no jogo.

Ao compararmos suas proezas com outros jogadores notáveis, não há dúvida de que LeBron James se destaca como uma figura lendária, cujo impacto transcende os números e os títulos conquistados. Sua presença em quadra é verdadeiramente incomparável, redefinindo os padrões de excelência e servindo de inspiração para gerações futuras de atletas.

8 Fun Fact:

Decidimos trazer uma curiosidade em relação ao mundo do basquete e da NBA, que se trata dos colleges que mais ingressaram alunos na NBA e o numero de jogadores não matriculados em colleges.